专利摘要:
テンプレート画像の大きさを変化させて照合しても、高速化できるテンプレート照合装置を提供する。テンプレート照合装置は、テンプレート画像を入力するテンプレート入力部100と、照合対象となる画像を入力する信号入力部101と、テンプレート画像を伸縮するテンプレート伸縮部102と、伸縮したテンプレート画像と入力画像とを照合する照合部103と、照合によって得られた類似度に基づいてテンプレート画像の伸縮率を決定する限界値算出部104と、予め定められた伸縮率の範囲内を全て照合し終えると、照合結果を出力する結果出力部105とから構成される。
公开号:JP2011514991A
申请号:JP2009514299
申请日:2009-03-02
公开日:2011-05-12
发明作者:善啓 大盛
申请人:株式会社東芝;
IPC主号:G06T7-00
专利说明:

[0001] 本発明は、テンプレートを拡大、又は、縮小しながら入力信号と高速に照合するテンプレート照合装置及びその方法に関する。]
背景技術

[0002] 非特許文献1が開示するテンプレート画像照合において、予め与えられた閾値θに達しない類似度をもつ領域内で照合を省略することによって高速に探索するアクティブ探索法が提案されている。]
[0003] テンプレート画像を僅かに移動しても類似度が急激に変化しない性質に基づいて、テンプレート画像の周囲における類似度の上限からその領域は導かれる。]
[0004] これにより、アクティブ探索法はテンプレート画像の位置の検出に関して高速化した。]
先行技術

[0005] 村瀬洋、V.V.Vinod、「局所色情報を用いた高速物体検索・アクティブ探索法」 信学論(D−II)、vol.J81−D−II、no.9、pp.2035−2042、Sept.1998.]
発明が解決しようとする課題

[0006] 入力画像中で照合する大きさが不明の場合、テンプレート画像の大きさを少しずつ変化させることによってテンプレートを探索する必要がある。そのため、従来手法は大きさの変化に関して高速化できなかった。]
[0007] そこで、本発明は、テンプレート画像の大きさを変化させて照合しても、高速化できるテンプレート照合装置及びその方法を提供する。]
課題を解決するための手段

[0008] 本発明は、入力信号を入力する入力部と、(1)予め決められた初期値の大きさのテンプレート、又は、前記初期値の大きさのテンプレートを任意の伸縮率で順番に拡大、又は、縮小したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める探索部と、前記最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が閾値を超えないように、前記テンプレートの前記伸縮率の拡大上限値、又は、縮小下限値を算出する限界値算出部と、前記拡大上限値内、又は、前記縮小下限値内の前記伸縮率によって前記テンプレートを拡大、又は、縮小する伸縮部と、前記テンプレートの大きさが任意の範囲に至るまで、前記テンプレートを前記伸縮部によって拡大、又は、縮小し、前記探索部によって、前記拡大、又は、縮小したテンプレートによって探索を繰り返す繰り返し部と、を有するテンプレート照合装置である。]
[0009] また、本発明は、入力信号を入力する入力部と、(1)予め決められた初期値の大きさのテンプレート、又は、前記初期値の大きさのテンプレートを任意の伸縮範囲内の伸縮率で順番に拡大、又は、縮小したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第1探索部と、前記最大類似度に基づいて前記テンプレートを拡大、又は、縮小したときの、前記入力信号に対する予測最大類似度を予測する予測部と、前記予測最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が閾値を超えないように、前記テンプレートの前記伸縮率の上限値と下限値を算出する第1限界値算出部と、前記上限値と前記下限値から決まる伸縮範囲内の前記伸縮率によって前記テンプレートを伸縮する伸縮部と、(1)前記伸縮したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第2探索部と、前記最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が前記閾値を超えないように、前記テンプレートの伸縮率の拡大上限値、又は、縮小下限値からなる伸縮範囲を算出する第2限界値算出部と、前記第2限界値算出部によって求められた前記伸縮範囲と、前記第1探索部で探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なっていない場合には、前記伸縮部で用いられる前記伸縮率を変化させるバックトラック部と、前記第2限界値算出部によって求められた前記伸縮範囲と、前記第1探索部で探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なった場合には、前記第1探索部からの最大類似度に代えて前記第2探索部からの前記最大類似度を前記予測部で用いるように制御する更新部と、前記テンプレートの大きさが任意の範囲に至るまで、前記テンプレートを前記伸縮部によって拡大、又は、縮小し、前記第1探索部と前記第2探索部によって前記拡大、又は、縮小したテンプレートによって探索を繰り返す繰り返し部と、を有するテンプレート照合装置である。]
発明の効果

[0010] 本発明によれば、探索もれを生じないで、テンプレートの伸縮回数を低減して探索を高速化できる。]
図面の簡単な説明

[0011] 実施例1に係わるテンプレート照合装置の構成を示すブロック図である。
実施例1の動作を示すフローチャートである。
実施例1による画像照合の概要説明図である。
実施例1によるテンプレート拡大時の伸縮率上限の算出方法を説明するための図である。
実施例1によるテンプレート縮小時の伸縮率下限の算出方法を説明するための図である。
実施例1によって伸縮幅を変化させながら照合する様子を説明するための図である。
実施例1の第3の変更例でヒストグラム特徴の分布が急激に変化する場合を説明するための図である。
実施例1の第3の変更例でヒストグラム特徴の分布が急激に変化しない場合を説明するための図である。
実施例2による音声照合の概要説明図である。
実施例2によるテンプレート拡大時の伸縮率上限の算出方法を説明するための図である。
実施例2によるテンプレート縮小時の伸縮率下限の算出方法を説明するための図である。
実施例2によって伸縮幅を変化させながら照合する様子を説明するための図である。
実施例2による音声照合と従来手法との処理速度を比較した実験結果である。
実施例4によるテンプレート伸縮時の伸縮率上限の算出方法を説明するための図である。]
実施例

[0012] 以下、本発明の一実施例のテンプレート照合装置について図面に基づいて説明する。]
[0013] 実施例1では、探索空間が2次元のテンプレート照合装置を説明し、実施例2では、探索空間が1次元のテンプレート照合装置を説明し、実施例3では、探索空間がn次元のテンプレート照合装置を説明し、実施例4では、探索空間がn次元であって、テンプレートの伸縮率が各次元で異なるテンプレート照合装置を説明し、実施例5では平均輝度値によるノルムによって類似度(距離の逆数)を算出するテンプレート照合装置を説明する。]
[0014] (1 実施例1)
本発明の実施例1のテンプレート照合装置について図1〜図6に基づいて説明する。] 図1 図2 図3 図4 図5 図6
[0015] 本実施例では、2次元探索空間として画像照合を例にとって説明する。そして、テンプレート画像の伸縮率αで拡大、又は、縮小させながら照合する。照合した結果、最も類似度が大きかったテンプレート画像の縮尺率αmaxと、その位置(xmax,ymax)を出力する。]
[0016] (1−1)テンプレート照合装置の構成
図1は、テンプレート照合装置を示すブロック図である。] 図1
[0017] テンプレート照合装置は、テンプレート画像を入力するテンプレート入力部100と、照合対象となる画像を入力する信号入力部101と、テンプレート画像を伸縮するテンプレート伸縮部102と、伸縮したテンプレート画像と入力画像とを照合する照合部103と、照合によって得られた類似度に基づいてテンプレート画像の伸縮率を決定する限界値算出部104と、予め定められた伸縮率の範囲内を全て照合し終えると、照合結果を出力する結果出力部105とから構成される。]
[0018] テンプレート入力部100は、テンプレート画像信号を入力してメモリに記憶する。]
[0019] 信号入力部101は、テンプレート画像と照合する対象となる画像を入力してメモリに記憶する。]
[0020] テンプレート伸縮部102は、後述する限界値算出部104が決定する伸縮率に基づいてテンプレート画像を伸縮してメモリに記憶する。]
[0021] 照合部103は、テンプレート伸縮部で伸縮されたテンプレート画像と、信号入力部で入力した入力画像とを照合し、類似度が最大になる位置を検出する。]
[0022] 限界値算出部104は、照合部103で検出された類似度に基づいて、テンプレートを伸縮できる上限又は下限の少なくとも一つを算出する。]
[0023] 結果出力部105は、最も類似度が高かった伸縮率と、入力画像中での位置を出力する。]
[0024] なお、このテンプレート照合装置は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いることでも実現することが可能である。すなわち、テンプレート入力部100、信号入力部101、テンプレート伸縮部102、照合部103、限界値算出部104、及び、結果出力部105は、上記のコンピュータ装置に搭載されたプロセッサにプログラムを実行させることにより実現することができる。このとき、テンプレート照合装置は、上記のプログラムをコンピュータ装置に予めインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータ装置に適宜インストールすることで実現してもよい。また、B及びCは、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスクもしくはCD−R、CD−RW、DVD−RAM、DVD−Rなどの記憶媒体などを適宜利用して実現することができる。]
[0025] (1−2)拡大時
テンプレート照合装置の動作を図2、図3に基づいて説明する。図2は、テンプレート照合装置の動作を示すフローチャートである。図3は、画像照合の概要説明図である。] 図2 図3
[0026] 本実施例では、テンプレートを拡大しながら照合を進めても良いし、縮小しながら照合を進めても良い。以下に、まず、テンプレートの伸縮率を1倍からβlim倍(但し、βlim>1である)まで拡大しながら照合する場合を説明する。]
[0027] ステップ200において、限界値算出部104の伸縮率αを1に初期化する。]
[0028] 入力したテンプレートの大きさと現在のテンプレートの大きさの比を表す伸縮幅βを1に初期化する。]
[0029] 結果出力部105の最大類似度Smaxを0に初期化する。]
[0030] 探索位置(x,y)は探索空間の範囲外の(−1,−1)に初期化される。画像の位置は、原点(0,0)から各画素の縦横方向の最大数までの座標で表される。画像を走査する場合には、原点(0,0)の位置から順番に縦横方向で走査していく。]
[0031] テンプレート画像は予めテンプレート入力部100で入力してメモリに記憶しておく。]
[0032] 照合する対象である画像も予め信号入力部101で入力してメモリに記憶しておく。]
[0033] 閾値θを設定する。本発明では、θより小さい類似度をもつ位置は測定されない。]
[0034] ステップ201において、テンプレート伸縮部102は、伸縮率αで伸縮したテンプレート画像をメモリに記憶する。]
[0035] ステップ202において、照合部103は、伸縮されたテンプレートと入力画像を照合して、類似度が最大になる探索位置(x,y)とその類似度Sを検出する。]
[0036] 本実施形態において、正規化ヒストグラム交差が類似度として用いられる。その照合方法は、類似度が最大になる入力画像上での位置を検出できる方法ならば何でもよい。例えば、非特許文献1の村瀬等による方法や、全ての探索点を全て探索する方法で検出する。]
[0037] 正規化ヒストグラム交差は式1で求める。hw、htは、それぞれ入力画像上の探索窓とテンプレートの分布であるヒストグラムを表すm次元のベクトル、hwi、htiはそれぞれ入力画像上の探索窓とテンプレートのi番目のヒストグラム要素を表す。]
[0038] ステップ203において、結果出力部105は、伸縮率αと、類似度が最大になる位置(x,y)とその類似度Sを入力する。Smax>Sの場合には、Smax=Sに更新する。]
[0039] ステップ204において、限界値算出部104は、照合で検出された類似度の最大値Sと閾値θに基づいて、伸縮率の上限値αupperを算出する。αupperの算出方法は後述する。伸縮率αは上限値αupperを超えない範囲に設定する。αupperが予め決められた伸縮率の最小値αminを下回る場合には、α=αminとする。]
[0040] ステップ205において、伸縮幅をβ=β×αで更新する。]
[0041] ステップ206において、伸縮幅がβ≧βlimならばステップ201に戻り、ステップ201からステップ205までの処理を繰り返す。β>βlimならばステップ2
ステップ207において、結果出力部105は、最大類似度Smaxとその探索位置(x,y)を出力し、処理を終了する。]
[0042] (1−3)拡大時の伸縮率上限の算出方法
次に、テンプレート拡大時の伸縮率上限の算出方法について図4、図6に基づいて説明する。] 図4 図6
[0043] 図4は、テンプレート拡大時の伸縮率上限の算出方法を説明するための図である。] 図4
[0044] 図4の上部が元の大きさのテンプレート画像と入力画像を照合する様子であり、図4の下部が拡大されたテンプレート画像と入力画像を照合する様子を示す。図6は、伸縮幅βを変化させながら照合する様子を説明するための図である。] 図4 図6
[0045] Sは、元の大きさのテンプレートでの類似度である。但し、0≦S≦1である。]
[0046] Sb1は、拡大後における元のテンプレートの範囲内での最大類似度である。但し、0≦Sb1≦1である。]
[0047] Sb2は、拡大後におけるテンプレートのはみ出しによる最大類似度である。但し、0≦Sb2≦1である。]
[0048] αは、テンプレートの一辺の伸縮率(拡大率)である。但し、1<αである。]
[0049] R1は、元のテンプレートでの照合範囲である探索窓である。]
[0050] R2は、拡大したテンプレートでの探索窓である。]
[0051] このようにテンプレートをα倍にして照合すると、図4中左下の網掛け領域に示すように、拡大されたテンプレート上での一致画素数はα2倍に増える。] 図4
[0052] 正規化ヒストグラム交差で類似度を算出する際に、入力画像上で一致する可能性のある画素が十分多いと仮定すると、図4中右下の斜線領域に示すように、元のテンプレートでの探索窓R1における拡大後の類似度上限はSb1=Sとなる。] 図4
[0053] 一方、拡大したテンプレートでの探索窓R2のうち、R1をはみ出した領域は全て類似度の増加に寄与すると仮定すると、 はみ出しによる最大類似度はSb2=1−1/α2となる。したがって、拡大後の類似度上限は以下の式2で表せる。]
[0054] Sb=Sb1+Sb2=S+1−1/α2 ・・・(2)

Sb<θをα2について解くと、

−1/α2<θ−1−S

となる。θは予め与えられた閾値とする。但し、0≦θ≦1である。そして、常にθ−1−S<0であるため、

α2<1/(1+S−θ)

となる。いまは拡大について考えているため、α2>1、すなわち、S<θでなければならない。]
[0055] したがって、Sb<θを満たすα2の範囲は以下の式3で表せる。]
[0056] 1<α2<1/(1+S−θ)、但し、S>θである。 ・・・(3)

(1−4)縮小時
上記ではテンプレートを拡大する場合について説明したが、テンプレートを縮小しても同様に高速化できる。この場合はステップ204とステップ206のみが異なる。以下に、テンプレートを1倍からαlower倍まで縮小しながら照合する場合について、その差分のみをステップ204’、ステップ206’として説明する。]
[0057] ステップ204’において、限界値算出部104は、照合で検出された類似度の最大値Sに基づいて、伸縮率の下限値αlowerを算出する。αlowerの算出方法は後述する。伸縮率αは下限値αlowerを下回らない範囲に設定する。αupperが予め決められた伸縮率の最小値αminを下回る場合には、α=αminとする。]
[0058] ステップ206’において、伸縮幅がβ≧βlimならばステップ201に戻り、ステップ201からステップ205までの処理を繰り返す。そうでなければステップ207に進む。]
[0059] (1−5)縮小時の伸縮率下限の算出方法
次に、テンプレート縮小時の伸縮率下限の算出方法について図5に基づいて説明する。] 図5
[0060] 図5は、テンプレート縮小時の伸縮率下限の算出方法を説明するための図である。図5の上部が元の大きさのテンプレート画像と入力画像を照合する様子であり、図5の下部が縮小されたテンプレート画像と入力画像を照合する様子を示す。] 図5
[0061] Sは、元の大きさのテンプレートでの類似度である。但し、0≦S≦1である。]
[0062] Scは、縮小後における元のテンプレートの範囲内での最大類似度である。但し、0≦Sb1≦1である。]
[0063] αは、テンプレートの一辺の伸縮率である。但し、0<α<1である。]
[0064] R1は、元のテンプレートでの探索窓である。]
[0065] R3は、縮小したテンプレートでの探索窓である。]
[0066] 図5中右下の網掛け領域に示すように、入力画像上での一致画素数は不変である。] 図5
[0067] そして、図5中左下の斜線領域に示すように、正規化ヒストグラム交差で類似度を算出する際に、テンプレート上で一致する可能性のある画素が十分多いと仮定すると、テンプレート縮小後の入力画像上での探索窓R2における類似度上限Sc=S/α2(但し、α<1である)となる。] 図5
[0068] 縮小では拡大のようなはみ出し領域は生じない。したがって、縮小後の類似度上限は以下の式4で表せる。]
[0069] Sc=S/α2 ・・・(4)

Sc<θを満たすα2の範囲を求めると以下の式5となる。]
[0070] S/θ<α2<1 ・・・(5)

(1−6)伸縮率
式3と式5をまとめてα=1の場合も含めると、α2の上限と下限は以下の式6で表せる。]
[0071] S/θ<α2<1/(1+S−θ) ・・・(6)

(1−7)効果
このように実施例1によれば、類似度が予め与えられた閾値θを下回るテンプレートの大きさでの照合を省略することで高速化ができる。]
[0072] (1−8 変更例1)
変更例1では、正規化ヒストグラム交差で類似度を算出する際に、一致する画素数に制限がある場合を説明する。すなわち、実施例1では、拡大したテンプレートと探索窓で一致する可能性のある画素数が十分に多いと仮定した。しかし、限りがある場合には、テンプレートの拡大による類似度増加は、実施例1の場合以下となり、よりテンプレートを大きくしないと類似度が閾値θを超えない。この性質を利用すると、伸縮率αの上限と下限をさらに広げることができる。]
[0073] (1−8−1)伸縮率の上限の算出方法
まず、正規化ヒストグラム交差で類似度を算出する際に、拡大したテンプレートと探索窓で一致する可能性のある画素数に限りがある場合について、伸縮率αの上限の算出方法を説明する。]
[0074] 拡大後の類似度Sb1を可能性のある最大値としないで、実際に算出する。本変更例では類似度を正規化ヒストグラム交差で算出するため、ヒストグラムのビン毎に上限を算出すると、式1を用いて、拡大後の類似度上限Sb(α2)は以下の式7で表せる。]
[0075] Sb(α2)=S(hw、α2ht)+1−1/α2 ・・・(7)

Sb(α2)<θを満たすα2の範囲を求めることを考える。式7の右辺第一項S(hw、α2ht)と第三項−1/α2は、α2について単調増加するため、Sb(α2)はα2について単調増加する。よってα2の上限値は、Sb(α2)=θの解として求まる。例えば、方程式を満たすまでα2を微小に増加させながら方程式を満たすかどうかを調べる山登り法によって求まる。厳密解が得られない場合は、厳密解の近傍でSb(α2)<θを満たす近似解を求めれば良い。]
[0076] したがって、Sb(α2)<θを満たすα2の範囲は以下の式8で表される。但し、f−1(θ)は関数f(α)=θとなるαの値を表す。]
[0077] (1−8−2)伸縮率の下限の算出方法
縮小時にも、正規化ヒストグラム交差で類似度を算出する際に、拡大したテンプレートと探索窓で一致する可能性のある画素数に限りがある場合には、伸縮率αの下限をさらに小さくできる。以下にその下限の算出方法を説明する。]
[0078] 縮小後の類似度Scを可能性のある最大値としないで、実際に算出する。本変更例では類似度を正規化ヒストグラム交差で算出するため、ヒストグラムのビン毎に下限を算出すると、縮小後の類似度Sc(α2)は以下の式9で表せる。]
[0079] Sc(α2)<θを満たすα2の範囲を求めることを考える。式13の右辺はα2について単調減少するため、Sc(α2)はα2について単調増加する、よってα2の下限値は、Sc(α2)=θの解として求まる。]
[0080] したがって、Sc(α2)<θを満たすα2の範囲は以下の式10で表せる。]
[0081] (1−8−3)まとめ
式8と式10をまとめると、伸縮率α2の上限と下限は以下の式11で表せる。]
[0082] (1−8−4)効果
本変更例では、伸縮率αの上限と下限を算出する処理量は増加する。しかし、通常の画像照合では、伸縮率αの上限と下限を拡大できることによる処理の削減量と比較すると非常に小さい。よって、本変更例によって、さらに高速化ができる。]
[0083] (1−9 変更例2)
変更例2では、上限と下限の両方を利用する場合について説明する。すなわち、実施例1では、テンプレート画像を縮小させるのに、伸縮率の下限又は上限のうち一つのみを用いたが、これに限らず、伸縮率の上限と下限の両方を用いてもよい。]
[0084] この場合は、日本の特許第3474131号公報の探索窓の位置を伸縮率αに、類似度をステップ202で検出する類似度Sに置き換えて考える。テンプレートを拡大させながら照合する場合を以下に説明する。]
[0085] まず、テンプレート照合を行い、最大類似度Sを求める。伸縮率αの周辺の伸縮率でも最大類似度S’は急激に変化しないと仮定して、S’=Sと予測する。式6を用いて伸縮率の下限を求めると、√(S/θ)となる。テンプレートをα’倍した場合に算出した伸縮率の下限がαを含んで、伸縮幅が連続するようにα’を予測する。そのようなα’はいくつも存在するが、最もαから離れた位置からγ戻ったα’=√(S/θ)−γを伸縮度決定部104で決定する。但し、γは固定値とする。ここで連続とは、前回の伸縮率の上限と下限から決まる伸縮範囲と、今回の伸縮率の上限と下限から決まる伸縮範囲とが重なった状態をいう。もし、重なっていなければ、前回の伸縮範囲と、今回の伸縮範囲との間に隙間(探索しない伸縮率)ができて不連続となるからである。]
[0086] 実際にテンプレートをα’倍に拡大して、実際の類似度S"を算出し、実際の伸縮率の上限値αupper’と下限値αlower’を算出する。下限値はαlower’=√(S”/θ)なので、√(S/θ)≦√(S”/θ)−γの場合は伸縮率が連続し、そうでない場合は不連続であると判定する。]
[0087] 予測に失敗して伸縮率の範囲にαが含まれなかった場合、すなわち、伸縮率の上限値αupper’から下限値αlower’までの範囲と前回の伸縮率の上限値αupperから下限値αlowerまでの範囲とが重ならならず不連続となった場合には、伸縮率α’をαに近付けて、再度照合を試みるバックトラック処理を行う。伸縮率α’をαに近付ける方法は何でも良く、伸縮率αに近づく方向に伸縮率α’を固定幅や固定倍率増減させても良いし、α’とαの2値の平均値を新たなα’としても良い。]
[0088] 予測に成功した場合は、新たな最大類似度をαmaxとし、全ての伸縮範囲を探索するまで上記の処理を繰り返す。]
[0089] 本変更例によれば、実施例1と比較して伸縮率の変化幅を大きくでき、さらに高速化できる。テンプレートを縮小しながら照合する場合も上記と同様に高速化できる。]
[0090] (1−10 変更例3)
変更例3では、テンプレートの拡大・縮小方法の具体例を図7と図8に基づいて説明する。すなわち、実施例1におけるテンプレートの伸縮方法は、伸縮前と伸縮後でヒストグラム特徴の分布が急激に変化しない方法が望ましい。] 図7 図8
[0091] 4×4のテンプレート画像を2×2に縮小する場合を例にとって説明する。縮小前のテンプレートの各要素を、P1(x,y)、縮小後の要素をP2(x,y)で表す。但しxは行、yは列を表す。]
[0092] (1−10−1)問題点
図7は、テンプレート画像を4分割して、それぞれの領域の輝度値を平均する場合を示す。輝度値の最大値を8とし、縮小前には輝度値が0と8の2種類しかないとする。図7の下図は、輝度値に対する出現頻度を表す。縮小前には、輝度値が0と8の画素が同数ある。] 図7
[0093] 平均によって画像を縮小すると、

P2(1,1)=(8+0+8+0)/4=4、

P2(1,2)=4、

P2(2,1)=(0+0+8+0)/4=2、

P2(2,2)=(8+8+0+8)/4=6

となる。]
[0094] よって、図7の下図の分布図に示すように、輝度値の頻度分布が大きく変わって、縮小前とは異なる輝度値が出現してしまう。実施例1では、類似度を正規化ヒストグラム交差で算出するため、輝度値のヒストグラム特徴の分布が大きく変化すると、類似度が意味をなさなくなる可能性があるという問題点がある。] 図7
[0095] (1−10−2)解決方法
図8は、テンプレート画像を4分割して、それぞれの領域から代表する画素をランダムに選択する場合を示す。この場合は、縮小前とは異なる輝度値が出現せず、輝度値のヒストグラム特徴の分布が大きく変わらないため、正規化ヒストグラム交差を算出できる。] 図8
[0096] (1−11 変更例4)
変更例4では、入力画像を分割する場合を説明する。すなわち、実施例1では、ステップ202において入力画像全体でテンプレート照合した。ステップ202では入力画像の類似度の最大値Sを算出するため、入力画像のほとんどが類似度0であっても一点だけ類似度が大きい場合には、テンプレートの伸縮率を大きく変化できない。]
[0097] そこで、入力画像を複数の領域に分割して、各領域に独立してテンプレート照合しても良い。例えば、入力画像を4分割して、それぞれの領域を独立した画像とみなしてテンプレート照合する。]
[0098] これにより、テンプレートと類似する部分が少ししか含まれない入力画像も、テンプレートと類似する部分を含む領域のみを詳細に探索して、その他の領域は伸縮率の変化を大きくして高速に探索できる。]
[0099] また、入力画像の各画素を分割領域とみなしても良い。テンプレートを拡大しながら照合する場合は、まず、入力画像の各画素について、伸縮率の上限値を記憶する。上限値の最小値を次のテンプレートの伸縮率として変化させた場合に、各画素に記憶された上限値の範囲内ならば類似度の算出を省略する。]
[0100] (2 実施例2)
本発明の実施例2のテンプレート照合装置について図9〜図13に基づいて説明する。] 図10 図11 図12 図13 図9
[0101] 本実施例では、1次元探索空間の場合について説明する。すなわち、実施例1では探索空間が2次元である画像照合を例にとって説明したが、本実施例では、テンプレート照合装置を1次元の探索空間に適用する。具体的には、音声照合を例にとって説明する。音声照合において伸縮とは、音声信号を時間方向に伸縮することをいう。]
[0102] 本実施例に係わる音声のテンプレート照合装置における構成と処理手順は、実施例1に係わる画像のテンプレート照合装置と同一であり、限界値算出部104での伸縮率の算出方法のみが異なる。以下にその方法を説明する。]
[0103] (2−1)拡大時
まず、テンプレートを1倍からαupper倍(但し、αupper>1である)まで拡大しながら照合する場合を説明する。]
[0104] 図9は、音声照合の概要説明図である。画像照合の場合と同様に、図9中右側のテンプレートを伸縮させながら、図9中左側の入力音声と照合する。] 図9
[0105] 図10は、テンプレート拡大時の伸縮率上限の算出方法を説明するための図である。] 図10
[0106] 図10の上部が、元の大きさのテンプレート音声と入力音声を照合する様子であり、図10の下部が、拡大されたテンプレート音声と入力音声を照合する様子を示す。] 図10
[0107] Sは、元の大きさのテンプレートでの類似度である。但し、0≦S≦1である。]
[0108] Sb1は、拡大後における元のテンプレートの範囲内での類似度の上限値である。但し、0≦Sb1≦1である。]
[0109] Sb2は、拡大後におけるテンプレートのはみ出しによる類似度の上限値である。但し、0≦Sb2≦1である
αは、テンプレートの一辺の伸縮率である。但し、1<αであう。]
[0110] そして、図10中左下の網掛け領域に示すように、拡大されたテンプレート上での一致画素数はα倍に増える。図10中右下の斜線領域に示しように、正規化ヒストグラム交差で類似度を算出する際に、入力画像上で一致する可能性のある画素が十分多いと仮定すると、元のテンプレートでの拡大後の類似度上限Sb1=Sとなる。] 図10
[0111] 一方、拡大したテンプレートでのR1をはみ出した領域は全て類似度増加に寄与し得る。よって、はみ出しによる最大類似度はSb2=1−1/αとなる。したがって、拡大後の類似度上限は以下の式12で表せる。]
[0112] Sb=Sb1+Sb2=1+S−1/α ・・・(12)

Sb<θを満たすαの範囲を求めると以下の式13で表せる。]
[0113] 1<α<1/(1+S−θ)、但し、S>θである。 ・・・(13)

(2−2)縮小時
次に、テンプレートを1倍からαlower倍(但し、αlower<1である)まで縮小しながら照合する場合を図11に基づいて説明する。] 図11
[0114] 図11中右下の網掛け領域に示すように、入力音声上での一致サンプル数は不変である。図11中左下の斜線領域に示すように、正規化ヒストグラム交差で類似度を算出する際に、テンプレート上で一致する可能性のあるサンプルが十分多いと仮定すると、テンプレート縮小後の入力音声上での類似度上限Sc=S/α(但し、α<1である)となる。] 図11
[0115] 縮小では拡大のようなはみ出し領域は生じない。したがって、縮小後の類似度上限は以下の式14で表せる。]
[0116] Sc=S/α ・・・(14)

Sc<θを満たすαの範囲を求めると以下の式15となる。]
[0117] S/θ<α<1 ・・・(15)

(2−3)まとめ
式13と式15をまとめると、伸縮率αの上限と下限は以下の式16で表せる。]
[0118] S/θ<α<1/(1+S−θ) ・・・(16)

(2−4)効果
このように本実施例によれば、音声信号を照合する場合には、画像照合のα2をαに置き換えた式16で、伸縮度の上限と下限が求まる。]
[0119] 図13に音声照合において、実施例2による処理時間と従来手法の処理時間を比較した結果を示す。図13に示すように20倍以上高速化できた。] 図13
[0120] (2−5)変更例
実施例1の第1の変更例と同様に、拡大したテンプレートと探索窓で一致する可能性のある画素数に限りがある場合には、式15のα2をαに置き換えた以下の式17で表せる。]
[0121] (3 実施例3)
本発明の実施例3のテンプレート照合装置について説明する。]
[0122] 本実施例では、n次元探索空間の場合について説明する。すなわち、実施例1では探索空間が2次元である画像照合を例にとって説明し、実施例2では探索空間が1次元である音声照合を例にとって説明した。本実施例では、n次元の探索空間での信号照合に拡張した場合について説明する。]
[0123] 伸縮時に正規化ヒストグラム交差で類似度を算出する際に、一致する可能性のある信号が十分にある場合には、伸縮率αnの上限と下限は以下の式18で表せる。]
[0124] S/θ<αn<1/(1+S−θ) ・・・(18)

実施例1の第1の変更例と同様に、正規化ヒストグラム交差で類似度を算出する際に、拡大したテンプレートと探索窓で一致する可能性のある画素数に限りがある場合には、伸縮時に一致する信号に限りがあることを考慮する場合には、伸縮率αnの上限と下限は以下の式19で表せる。]
[0125] (4 実施例4)
本発明の実施例4のテンプレート照合装置について図14に基づいて説明する。] 図14
[0126] 本実施例では、伸縮率が各次元で独立の場合について説明する。すなわち、探索空間が2次元以上のこれまでの各実施例では、各次元の伸縮率は等倍率としたが、本実施例では、各次元の伸縮率が異なる場合について説明する。]
[0127] (4−1)2次元の場合
図14を用いて、2次元の探索空間である画像探索の場合のテンプレート伸縮時の伸縮率上限の算出方法を説明する。図14は図4とほとんど同じであるが、テンプレートの伸縮率が縦α1、横α2で均一でない点が異なる。] 図14 図4
[0128] 図14中左下の網掛け領域に示すように、拡大されたテンプレート上での一致画素数はα1×α2倍に増える。図14中右下の斜線部分に示すように、正規化ヒストグラム交差で類似度を算出する際に、入力画像上で一致する可能性のある画素が十分に多いと仮定すると、元のテンプレートでの探索窓R1における拡
大後の類似度上限はSb1=Sとなる。] 図14
[0129] 一方、拡大したテンプレートでの探索窓R2のうち、R1をはみ出した領域は全て類似度増加に寄与し得る。よって、この図14のようにα1>1、α2<1の場合には、はみ出しによる最大類似度は、

Sb2=1−1/α1×1

となる。辺が縮小する場合にははみ出しがなくなることを考慮して一般的に表すと、

Sb2=1−min(1,1/α1)×min(1,1/α2)

と表せる。したがって、拡大後の類似度上限は以下の式20で表せる。但し、関数min(・)は2つの変数の最小値を出力する関数とする。] 図14
[0130] Sb=Sb1+Sb2=S+1−min(1,1/α1)×(1,1/α2)

・・・(20)

(4−2)n次元の場合
次に、より一般的なn次元の場合について説明する。]
[0131] 図1のように入力信号に一致する信号が十分にある場合には、

Sb1=S、

Sb2=1−min(1,1/α1)×min(1,1/α2)×・・・×min(1,1/αn)

となる。この場合は伸縮率の上限を与える。] 図1
[0132] 図5のように、正規化ヒストグラム交差で類似度を算出する際に、テンプレートに一致する信号が十分にある場合には、

Sb1=S/(min(1,1/α1)×min(1,1/α2)×・・・×min(1,1/αn))、

Sb2=1−min(1,1/α1)×min(1,1/α2)×・・・×min(1,1/αn)

となる。この場合は伸縮率の下限を与える。] 図5
[0133] したがって、n次元の伸縮率ベクトルαの上限と下限は以下の式21で表せる。]
[0134] (4−3)変更例
実施例1の第1の変更例と同様に、正規化ヒストグラム交差で類似度を算出する際に、拡大したテンプレートと探索窓で一致する可能性のある画素数に限りがある場合には、伸縮率ベクトルαの上限と下限は以下の式22で表せる。但し、Iは単位ベクトルを表す。]
[0135] (5 実施例5)
実施例5では、実施例1で用いる類似度として、輝度平均値のノルムによって算出する距離を用い
る場合を説明する。すなわち、これまでの実施例では、ステップ203において、テンプレート画像の特徴量のヒストグラムと、入力画像の特徴量のヒストグラムの間で正規化ヒストグラム交差を算出したが、テンプレート画像の伸縮によって類似度の上限が求まる方法であれば、類似度の算出方法は何でも良い。]
[0136] ここではその一例として、平均輝度のL1ノルム、すなわち差分の絶対値を用いる場合を説明する。但し、類似度の代わりに距離を用いる場合は、数値の大小の意味が反転するから、類似度の上限を求めることに注意が必要である。]
[0137] (5−1)拡大時の伸縮率上限の算出方法
まず、テンプレート画像を拡大する場合を説明する。テンプレート画像及び入力画像の平均輝度値をそれぞれc1、c2、閾値をθとすると、距離はD=|c1−c2|で求まる。但し、|・|は絶対値を出力するものとする。c2−c1>θの場合とc1−c2>θの場合に分けて説明する。]
[0138] (5−1−1)拡大時にc2−c1>θの場合
テンプレート画像の平均輝度c2よりも入力画像の平均輝度c1の方が大きい場合であり、入力画像上に設定した探索窓の拡大後の平均輝度c2’を減少させることを考える。拡大によってはみ出した領域全てが平均輝度c2’の減少に寄与すると仮定すると、c2’=c2/α2となる。よって拡大後の距離Db=c2’−c1はDb=c2/α2—c1となる。Db>θをα2について解くと、

α2<c2/(c1+θ) ・・・(23)

となる。]
[0139] (5−1−2)拡大時にc1−c2>θの場合
テンプレート画像の平均輝度c2よりも入力画像の平均輝度c1の方が小さい場合であり、入力画像上に設定した探索窓の拡大後の平均輝度c2’を増加させることを考える。拡大によってはみ出した領域全てが平均輝度c2’の増加に寄与すると仮定すると、c2’=(c2+α2−1)/α2となる。よって拡大後の距離Db=c1−c2’はDb=c1−(c2+α2−1)/α2となる。Db>θをα2について解くと、

α2<(1−c2)/(1−c1+θ) ・・・(24)

となる。]
[0140] (5−2)縮小時の伸縮率上限の算出方法
縮小時もc2−c1>θの場合とc1−c2>θの場合に分けて説明する。]
[0141] (5−2−1)縮小時にc2−c1>θの場合
テンプレート画像の平均輝度c2よりも入力画像の平均輝度c1の方が大きい場合であり、入力画像上に設定した探索窓の縮小後の平均輝度c2’を減少させることを考える。縮小によって探索窓の範囲外となる領域全てが平均輝度c2’の減少に寄与すると仮定すると、c2’=(c1+α2−1)/α2となる。よって縮小後の距離Dc=c2’−c1はDc=(c1+α2−1)/α2−c1となる。Dc>θをα2について解くと、

α2>(1−c2)/(1−c1−θ) ・・・(25)

となる。]
[0142] (5−2−2)縮小時にc1−c2>θの場合
テンプレート画像の平均輝度c2よりも入力画像の平均輝度c1の方が小さい場合であり、入力画像上に設定した探索窓の縮小後の平均輝度c2’を増加させることを考える。縮小によって探索窓の範囲外となる領域全てが平均輝度c2’の増加に寄与すると仮定すると、c2’=c2/α2となる。よって縮小後の距離Dc=c1−c2’は、c1−c2/α2となる。Dc>θをα2について解くと、

α2>c2/(c1−θ) ・・・(26)

となる。]
[0143] (5−3)まとめ
式23と式24をまとめると、c2−c1>θの場合は

(1−c2)/(1−c1−θ)<α2<c2/(c1+θ) ・・・(27)

となる。]
[0144] 式24と式26をまとめると、c1−c2>θの場合は

c2/(c1−θ)<α2<(1−c2)/(1−c1+θ) ・・・(28)

となる。]
[0145] (5−4)変更例
実施例5では距離の算出方法としてL1ノルムを用いたが、差の2乗和であるL2ノルム、差のn乗和であるLnノルムを用いても良い。]
[0146] また、実施例5では探索空間が2次元である画像照合を例にとって説明したが、探索空間が1次元である音声照合や、探索空間がn次元でも良い。その場合は式27及び式28におけるα2が、1次元の場合はα、n次元の場合はαnとなる。]
[0147] あるいは、ノルムによって距離を算出しなくても、距離の下限が求まる方法であれば距離の算出方法は何でも良い。類似度の場合は類似度の上限が求まる方法であれば何でも良い。]
[0148] (6 変更例)
本発明は上記各実施例そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。]
[0149] また、上記実施例に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施例に示される全構成要素から幾つかの構成要素を削除してもよい。]
[0150] さらに、異なる実施例にわたる構成要素を適宜組み合わせてもよい。]
权利要求:

請求項1
入力信号が入力する入力部と、(1)予め決められた初期値の大きさのテンプレート、又は、前記初期値の大きさのテンプレートを任意の伸縮率で順番に拡大、又は、縮小したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める探索部と、前記最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が閾値を超えないように、前記テンプレートの前記伸縮率の拡大上限値、又は、縮小下限値を算出する限界値算出部と、前記拡大上限値内、又は、前記縮小下限値内の前記伸縮率によって前記テンプレートを拡大、又は、縮小する伸縮部と、前記テンプレートの大きさが任意の範囲に至るまで、前記テンプレートを前記伸縮部によって拡大、又は、縮小し、前記探索部によって、前記拡大、又は、縮小したテンプレートによって探索を繰り返す繰り返し部と、を有するテンプレート照合装置。
請求項2
入力信号が入力する入力部と、(1)予め決められた初期値の大きさのテンプレート、又は、前記初期値の大きさのテンプレートを任意の伸縮範囲内の伸縮率で順番に拡大、又は、縮小したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第1探索部と、前記最大類似度に基づいて前記テンプレートを拡大、又は、縮小したときの、前記入力信号に対する予測最大類似度を予測する予測部と、前記予測最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が閾値を超えないように、前記テンプレートの前記伸縮率の上限値と下限値を算出する第1限界値算出部と、前記上限値と前記下限値から決まる伸縮範囲内の前記伸縮率によって前記テンプレートを伸縮する伸縮部と、(1)前記伸縮したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第2探索部と、前記最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が前記閾値を超えないように、前記テンプレートの伸縮率の拡大上限値、又は、縮小下限値からなる伸縮範囲を算出する第2限界値算出部と、前記第2限界値算出部によって求められた前記伸縮範囲と、前記第1探索部で探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なっていない場合には、前記伸縮部で用いられる前記伸縮率を変化させるバックトラック部と、前記第2限界値算出部によって求められた前記伸縮範囲と、前記第1探索部で探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なった場合には、前記第1探索部からの最大類似度に代えて前記第2探索部からの前記最大類似度を前記予測部で用いるように制御する更新部と、前記テンプレートの大きさが任意の範囲に至るまで、前記テンプレートを前記伸縮部によって拡大、又は、縮小し、前記第1探索部と前記第2探索部によって前記拡大、又は、縮小したテンプレートによって探索を繰り返す繰り返し部と、を有するテンプレート照合装置。
請求項3
前記限界値算出部、前記第1限界値算出部、又は、前記第2限界値算出部は、n次元の前記テンプレートの全ての次元の長さが等倍率の前記伸縮率α(但し、α>0である)で拡大、又は、縮小する場合に、前記限界値算出部、前記第1限界値算出部、又は、前記第2限界値算出部は、S(但し、0≦S≦1である)を前記照合部によって算出された前回の最大類似度、θ(但し、0≦θ≦1である)を前記閾値として、S/θ<αn<1/(1+S−θ)・・・(A)によって前記伸縮率αの前記上限値と前記下限値を算出する、請求項2記載のテンプレート照合装置。
請求項4
前記探索部、前記第1探索部、又は、前記第2探索部は、正規化ヒストグラム交差で前記類似度を算出する、請求項2記載のテンプレート照合装置。
請求項5
n次元の前記テンプレートの全ての次元の長さが等倍率の前記伸縮率α(但し、α>0である)で拡大、又は、縮小する場合において、前記探索部、前記第1探索部、又は、前記第2探索部は、S(但し、0≦S≦1である)を前記照合部によって前回の探索で算出された最大類似度、θ(0≦θ≦1)を前記閾値、hw、htを、それぞれ前記入力信号上の前記探索窓中の特徴量の分布と前記テンプレートの特徴量の分布であるヒストグラムを表すm次元のベクトル、hwi、htiをそれぞれ前記入力信号上の前記探索窓の特徴量と前記テンプレートの特徴量のi番目のヒストグラム要素を表すとすると、今回の最大類似度を下記の式Bによって示す関数S(・)で算出し、前記限界値算出部、前記第1限界値算出部、又は、前記第2限界値算出部は、下記の式Cで前記伸縮率αの前記上限値と前記下限値を算出し、但し、f(θ)−1はf(α)=θを満たすベクトルである前記伸縮率αを出力するものとする、請求項4記載のテンプレート照合装置。
請求項6
n次元の前記テンプレートの各次元の長さが異なる前記伸縮率αi(但し、αi>0であり、1<i<nである)で拡大、又は、縮小する場合において、前記限界値算出部、前記第1限界値算出部、又は、前記第2限界値算出部は、下記の式Dで前記伸縮率αの前記上限値と前記下限値を算出し、請求項2記載のテンプレート照合装置。
請求項7
前記探索部、前記第1探索部、又は、前記第2探索部は、前記入力信号を複数の領域に分割し、前記探索を前記分割した領域毎に行う、請求項2記載のテンプレート照合装置。
請求項8
前記探索部、前記第1探索部、又は、前記第2探索部は、平均輝度値によるノルムにを用いて類似度を算出する、請求項2記載のテンプレート照合装置。
請求項9
入力信号が入力する入力ステップと、(1)予め決められた初期値の大きさのテンプレート、又は、前記初期値の大きさのテンプレートを任意の伸縮範囲内の伸縮率で順番に拡大、又は、縮小したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第1探索ステップと、前記最大類似度に基づいて前記テンプレートを拡大、又は、縮小したときの、前記入力信号に対する予測最大類似度を予測する予測ステップと、前記予測最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が閾値を超えないように、前記テンプレートの前記伸縮率の上限値と下限値を算出する第1伸縮率算出ステップと、前記上限値と前記下限値から決まる伸縮範囲内の前記伸縮率によって前記テンプレートを伸縮する伸縮ステップと、(1)前記伸縮したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第2探索ステップと、前記最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が前記閾値を超えないように、前記テンプレートの伸縮率の拡大上限値、又は、縮小下限値からなる伸縮範囲を算出する第2伸縮率算出ステップと、前記第2伸縮率算出ステップによって求められた前記伸縮範囲と、前記第1探索ステップで探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なっていない場合には、前記伸縮ステップで用いられる前記伸縮率を変化させるバックトラックステップと、前記第2伸縮率算出ステップによって求められた前記伸縮範囲と、前記第1探索ステップで探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なった場合には、前記第1探索ステップからの最大類似度に代えて前記第2探索ステップからの前記最大類似度を前記予測ステップで用いるように制御する更新ステップと、前記テンプレートの大きさが任意の範囲に至るまで、前記テンプレートを前記伸縮ステップによって拡大、又は、縮小し、前記第1探索ステップと前記第2探索ステップによって前記拡大、又は、縮小したテンプレートによって探索を繰り返す繰り返しステップと、を有するテンプレート照合方法。
請求項10
コンピュータに、入力信号が入力する入力機能と、(1)予め決められた初期値の大きさのテンプレート、又は、前記初期値の大きさのテンプレートを任意の伸縮範囲内の伸縮率で順番に拡大、又は、縮小したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第1探索機能と、前記最大類似度に基づいて前記テンプレートを拡大、又は、縮小したときの、前記入力信号に対する予測最大類似度を予測する予測機能と、前記予測最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が閾値を超えないように、前記テンプレートの前記伸縮率の上限値と下限値を算出する第1伸縮率算出機能と、前記上限値と前記下限値から決まる伸縮範囲内の前記伸縮率によって前記テンプレートを伸縮する伸縮機能と、(1)前記伸縮したテンプレートを前記入力信号上で探索位置を移動させながら類似度を求めるものであり、(2)前記各探索位置において、前記テンプレートの特徴量の分布と前記入力信号における探索窓内の特徴量の分布に基づく類似度を求め、(3)前記類似度の中の最大類似度を求める第2探索機能と、前記最大類似度から、前記テンプレートを拡大、又は、縮小したときの最大類似度が前記閾値を超えないように、前記テンプレートの伸縮率の拡大上限値、又は、縮小下限値からなる伸縮範囲を算出する第2伸縮率算出機能と、前記第2伸縮率算出機能によって求められた前記伸縮範囲と、前記第1探索機能で探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なっていない場合には、前記伸縮機能で用いられる前記伸縮率を変化させるバックトラック機能と、前記第2伸縮率算出機能によって求められた前記伸縮範囲と、前記第1探索機能で探索に用いられた前記テンプレートの大きさを決定した前記伸縮範囲が重なった場合には、前記第1探索機能からの最大類似度に代えて前記第2探索機能からの前記最大類似度を前記予測機能で用いるように制御する更新機能と、前記テンプレートの大きさが任意の範囲に至るまで、前記テンプレートを前記伸縮機能によって拡大、又は、縮小し、前記第1探索機能と前記第2探索機能によって前記拡大、又は、縮小したテンプレートによって探索を繰り返す繰り返し機能と、を実現させるためのテンプレート照合プログラム。
类似技术:
公开号 | 公开日 | 专利标题
TWI684922B|2020-02-11|基於圖像的車輛定損方法、裝置、電子設備及系統
Tang et al.2018|Pyramidbox: A context-assisted single shot face detector
AU2015274708B2|2020-03-26|Rule-based video importance analysis
Chen et al.2016|Supervised transformer network for efficient face detection
US9953425B2|2018-04-24|Learning image categorization using related attributes
US10325181B2|2019-06-18|Image classification method, electronic device, and storage medium
US9665789B2|2017-05-30|Device and method for analyzing the correlation between an image and another image or between an image and a video
US8184914B2|2012-05-22|Method and system of person identification by facial image
Benhabiles et al.2011|Learning boundary edges for 3D‐mesh segmentation
US20160035078A1|2016-02-04|Image assessment using deep convolutional neural networks
Vilaplana et al.2008|Binary partition trees for object detection
JP4952625B2|2012-06-13|透視変換歪み発生文書画像補正装置および方法
US8200648B2|2012-06-12|Data similarity and importance using local and global evidence scores
US8331619B2|2012-12-11|Image processing apparatus and image processing method
Wang et al.2017|Face r-cnn
Barinova et al.2008|Fast automatic single-view 3-d reconstruction of urban scenes
Bishop et al.2003|Super-resolution Enhancement of Video.
Liu et al.2007|Gradient feature selection for online boosting
Felzenszwalb et al.2004|Efficient graph-based image segmentation
Grygorash et al.2006|Minimum spanning tree based clustering algorithms
JP4267475B2|2009-05-27|図面照合装置
KR100624481B1|2006-09-18|형판 기반 얼굴 검출 방법
JP4392886B2|2010-01-06|画像抽出方法及び装置
Suga et al.2008|Object recognition and segmentation using SIFT and Graph Cuts
US9785819B1|2017-10-10|Systems and methods for biometric image alignment
同族专利:
公开号 | 公开日
US8509544B2|2013-08-13|
WO2009113598A1|2009-09-17|
JP5380283B2|2014-01-08|
US20110002549A1|2011-01-06|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
JPS62196771A|1986-02-24|1987-08-31|Hitachi Ltd|Processing device for divided image|
JPH06174444A|1992-12-02|1994-06-24|Rozefu Technol:Kk|ディスクリート型電子部品のはんだ形態検査方法|
JP2001043374A|1999-07-29|2001-02-16|Waimu Up Kk|作動許否判定装置|
JP2001092486A|1999-09-20|2001-04-06|Nippon Telegr & Teleph Corp <Ntt>|高速信号探索方法、装置及びその記録媒体|
JP2001224014A|2000-02-14|2001-08-17|Nippon Telegr & Teleph Corp <Ntt>|物体検出方法および装置およびこの方法を記録した記録媒体|JP2012242890A|2011-05-16|2012-12-10|Toshiba Corp|探索省略領域設定関数生成方法、探索省略領域設定方法、オブジェクト探索方法、探索省略領域設定関数生成装置、探索省略領域設定装置、及びオブジェクト探索装置|US5987456A|1997-10-28|1999-11-16|University Of Masschusetts|Image retrieval by syntactic characterization of appearance|
US6944331B2|2001-10-26|2005-09-13|National Instruments Corporation|Locating regions in a target image using color matching, luminance pattern matching and hue plane pattern matching|
TWI230890B|2003-12-29|2005-04-11|Pixart Imaging Inc|Handheld pointing device and method for estimating a displacement|
US7516055B2|2004-08-20|2009-04-07|Chevron U.S.A. Inc|Multiple-point statistics simulation with enhanced computational efficiency|
US7263205B2|2004-12-06|2007-08-28|Dspv, Ltd.|System and method of generic symbol recognition and user authentication using a communication device with imaging capabilities|
US7526412B2|2006-03-31|2009-04-28|Biopassword, Inc.|Method and apparatus for multi-distant weighted scoring system|
EP1916538A3|2006-10-27|2011-02-16|Panasonic Electric Works Co., Ltd.|Target moving object tracking device|
WO2009113598A1|2008-03-13|2009-09-17|Kabushiki Kaisha Toshiba|Template matching apparatus and method thereof|WO2009113598A1|2008-03-13|2009-09-17|Kabushiki Kaisha Toshiba|Template matching apparatus and method thereof|
JP5505007B2|2010-03-18|2014-05-28|富士通株式会社|画像処理装置、画像処理方法及び画像処理用コンピュータプログラム|
EP2884459A4|2012-08-10|2016-03-30|Konica Minolta Inc|Image processing device, image processing method, and image processing program|
TWI512642B|2013-01-25|2015-12-11|Delta Electronics Inc|快速圖形比對方法|
JP2014225718A|2013-05-15|2014-12-04|ソニー株式会社|画像処理装置および画像処理方法|
CN106228194B|2016-08-05|2018-09-18|腾讯科技(深圳)有限公司|图像查找方法和装置|
法律状态:
2011-11-08| A621| Written request for application examination|Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111107 |
2013-05-29| A131| Notification of reasons for refusal|Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130528 |
2013-07-02| A521| Written amendment|Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130701 |
2013-08-26| TRDD| Decision of grant or rejection written|
2013-09-04| A01| Written decision to grant a patent or to grant a registration (utility model)|Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
2013-10-03| A61| First payment of annual fees (during grant procedure)|Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130930 |
2013-10-04| R151| Written notification of patent or utility model registration|Ref document number: 5380283 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
优先权:
申请号 | 申请日 | 专利标题
JP2008064537||2008-03-13||
JP2008064537||2008-03-13||
JP2009514299A|JP5380283B2|2008-03-13|2009-03-02|テンプレート照合装置及びその方法|
PCT/JP2009/054701|WO2009113598A1|2008-03-13|2009-03-02|Template matching apparatus and method thereof|JP2009514299A| JP5380283B2|2008-03-13|2009-03-02|テンプレート照合装置及びその方法|
[返回顶部]